“数据湖仓(Data Lakehouse)”是一种数据架构,把数据湖(Data Lake)的低成本、可扩展、支持多种原始数据格式,与数据仓库(Data Warehouse)的治理能力(如 ACID 事务、一致性、权限控制、性能优化、BI 友好)结合起来,用同一套底座同时支持数据工程、分析与机器学习等工作负载。
We store raw logs and analytics tables in a single data lakehouse.
我们把原始日志和分析表存放在同一个数据湖仓里。
By using a data lakehouse with ACID tables and fine-grained access control, the team reduced duplicate pipelines and delivered faster, more reliable dashboards.
通过使用带 ACID 表和细粒度访问控制的数据湖仓,团队减少了重复的数据管道,并更快、更可靠地交付了仪表盘。
/ˈdeɪtə ˈleɪkhaʊs/
“Lakehouse”是由 lake(湖)+ house(房子/仓)构成的混成词(portmanteau/复合造词思路),用来表达“像湖一样容纳多样数据、又像仓库一样可管理、可分析”的理念。该术语在云数据平台语境中流行起来,常与开放表格式、事务日志与统一治理能力一起出现。